★學會用「網路爬蟲」蒐集資料,告別苦力又傷眼的「複製、貼上」!★
在網路發達的時代,整個網路就像是一個大型資料庫,不論是想進行商品比價、想預測股價的漲跌趨勢、想知道競爭者的商品資訊、想了解社群網站的熱門議題,再搭配時事來規劃行銷活動、想透過匯率走勢預測何時可以低價買進美金或日幣、……等等,都可以從相關網站取得資料。
雖然取得資料不難,但是要如何將這些大量、雜亂的資料抓取下來並整理成有用的資訊,就是一門學問了。如果還不懂得運用「網路爬蟲」,就只能慢慢地複製、貼上資料了!
★徹底解析網頁結構,精確爬取目標資料不卡關★
為了幫助您學習網路爬蟲,本書使用Chrome瀏覽器的WebScraper擴充功能,讓您不用撰寫任何程式碼,就能夠輕鬆爬取約七成以上的網站資料,而且透過WebScraper工具,還可以幫您一邊爬取資料一邊學習HTML標籤+CSS選擇器,精確爬取目標資料,並從實作中了解Web網站的各種巡覽結構。
★互動式網頁資料也能抓!★
雖然WebScraper能夠爬取大多數的網站資料,但是對於JavaScript、AJAX技術等互動式的網頁資料,就不易直接爬取回來。我們將教您使用ExcelVBA+IE瀏覽器自動化來爬取互動網站,還可以建立ExcelVBA+Selenium網路爬蟲程式,讓您在網頁上看得到資料,就能夠爬得到資料。
★找出有意義的指標,做出最佳決策!★
最後,我們還將介紹如何用Excel內建功能,進行「資料清理」及「資料視覺化」,讓您充份掌握資訊,迅速做出最佳的決策。
本書特色:
►►►以StepbyStep的方式,解說WebScraper爬取資料的過程,消除初學者對寫程式的恐懼!
►►►以生活化的例子帶領初學者實際用WebScraper爬取資料,例如:足球聯賽成績、本週電影資訊、全國電子門市資料、NBA球員資料、各城市空氣品質與天氣資訊、股價資訊、匯率、……等,建立初學者的自信及成就感。
►►►教您使用Chrome的擴充功能,快速判別網頁內容是AJAX技術還是JavaScript產生的動態網頁,以便精確爬取目標資料。
►►►以豐富的實作案例,帶您建立ExcelVBA程式爬取JavaScript產生的動態網頁及使用者互動的網站。
互動式 SCRAPER 網站 NBA 目標 CHROME EXCEL 瀏覽器 網路 JAVASCRIPT HTML 資訊 資料 WEB AJAX